home *** CD-ROM | disk | FTP | other *** search
/ ftp.cs.arizona.edu / ftp.cs.arizona.edu.tar / ftp.cs.arizona.edu / icon / newsgrp / group98b.txt / 000017_icon-group-sender _Wed May 6 16:37:16 1998.msg < prev    next >
Internet Message Format  |  2000-09-20  |  3KB

  1. Return-Path: <icon-group-sender>
  2. Received: from kingfisher.CS.Arizona.EDU (kingfisher.CS.Arizona.EDU [192.12.69.239])
  3.     by baskerville.CS.Arizona.EDU (8.8.8/8.8.7) with SMTP id QAA17698
  4.     for <icon-group-addresses@baskerville.CS.Arizona.EDU>; Wed, 6 May 1998 16:37:16 -0700 (MST)
  5. Received: by kingfisher.CS.Arizona.EDU (5.65v4.0/1.1.8.2/08Nov94-0446PM)
  6.     id AA14346; Wed, 6 May 1998 16:37:12 -0700
  7. Message-Id: <s550a4ba.077@housmtp.oceaneering.com>
  8. X-Mailer: Novell GroupWise 4.1
  9. Date: Wed, 06 May 1998 17:55:54 -0500
  10. From: Charles Hethcoat <CHETHCOA@oss.oceaneering.com>
  11. To: icon-group@optima.CS.Arizona.EDU
  12. Subject: AI use for Icon -Reply
  13. Mime-Version: 1.0
  14. Content-Type: text/plain
  15. Content-Disposition: inline
  16. Errors-To: icon-group-errors@optima.CS.Arizona.EDU
  17. Status: RO
  18. Content-Length: 1963
  19.  
  20. Terry Murray <tmurray@primary.net> wrote:
  21.  
  22. >...message would come form a supervisor to the human resources
  23. department asking them to promote Mr. Any Body to a New Title on a
  24. certain date.  By having all the employees names prior to running the
  25. program I weight each name based on its reletive position to the other
  26. name within the organization to get a fuzzy match.  
  27.  
  28. If you get a fuzzy name match algorithm together, it sure would be a nice
  29. contribution to the Icon library...I don't know much about the methods
  30. used in these types of searches, but I'll give it some thought also.
  31.  
  32. >I'm now working on the 'when' to search for dates.  I need a different
  33. method than giving the program every possible date in every possible
  34. way.  
  35.  
  36. My first impulse says to try to find candidates for the elements first: year,
  37. month, day of week, and day written in every possible way.  Then dope
  38. out month from day separately, based partly on proximity, and then put
  39. the date in a canonical form such as yyyy-mm-dd.
  40.  
  41. December could be written (in English) as Dec or December (possibly
  42. misspelled), or as 12.  Years could be 1998 or 98 or '98.  Days could be
  43. 1..N where N is a well-known function of month (28..31).
  44.  
  45. By "proximity" I mean, for example, that a numeric month should be
  46. followed very shortly afterward by viable candidates for year and day,
  47. or it's probably not a date.
  48.  
  49. A date like 7/9 is ambiguous internationally:  July 9 in the U.S. but
  50. September 7 in Europe.  This can usually be resolved by knowing the
  51. origin of the writer.
  52.  
  53. Delimiters seem only to be slashes, dashes or spaces.
  54.  
  55. Seems like a job tailormade for Icon string scanning and tables.
  56.  
  57. >Does someone have a program that would pick a date out of a
  58. sentence?
  59.  
  60. Sorry, I don't.  It would make a another great library contribution.
  61.  
  62. Charles Hethcoat        
  63. Senior Engineer, Analysis Department
  64. Oceaneering Space Systems, Inc.
  65. 16665 Space Center Blvd., Houston, Texas 77058 USA
  66. chethcoa@oss.oceaneering.com
  67.  
  68.